@PhDThesis{Carvalho:2021:NeAlPo,
author = "Carvalho, Naiallen Carolyne Rodrigues Lima",
title = "Bisecting stochastic clustering: a new algorithm for PolSAR image
unsupervised classification",
school = "Instituto Nacional de Pesquisas Espaciais (INPE)",
year = "2021",
address = "S{\~a}o Jos{\'e} dos Campos",
month = "2020-11-10",
keywords = "stochastic distance, Riemann geometry, divisive hierarchical
clustering, PolSAR image, unsupervised classification, distancia
estocastica, geometria de Riemann, agrupamento divisivo
hierarquico, imagens PolSAR, classifica{\c{c}}{\~a}o n{\~a}o
supervisionada.",
abstract = "PolSAR (Polarimetric Synthetic Aperture Radar) images can be
represented by a set of complex Hermitian positive definite
matrices, which have a natural Riemannian metric tensor. PolSAR
images are, also, known for following the Wishart distribution,
and, by using the information theory contrast function, stochastic
distances between Wishart distributions can be derived. This work
addresses unsupervised classification strategies, explores the
Riemann geometry and studies stochastic distances applied to
PolSAR images. The proposed algorithm, named Bisecting Stochastic
Clustering (BSC), is a combination between the Stochastic
Clustering (SC) algorithm and the hierarchical divisive clustering
algorithm. The SC algorithm is technique based on K-means, which
uses stochastic distances as similarity metric. The SC algorithm
can, usually, be trapped in a local minimum, what led to incorrect
clustering results. Therefore, the choice of good initial
parameter candidates is essential for the clustering quality. The
BSC algorithm is a top-down procedure, it starts with all samples
in an unique cluster, that are successively splitted into two new
sub-clusters. This algorithm is mainly divided into three steps:
the initial parameter determination, the cluster bi-partitioning
procedure, and the choice of a suitable cluster to split. In this
work, two algorithms for the initial parameter determination are
tested: the Expectation-Maximization (EM) algorithm for Wishart
Mixture Model and the Riemann Principal Direction Divisive
Partitioning (RPDDP). The RPDDP is a new proposed algorithm, whose
goal is to perform the bi-partition of a dataset. This algorithm
estimates the dataset covariance matrix under the the Riemann
geometry, in order to find the principal component, which is used
to separate the input data in two sub-clusters. From the RPDDP two
estimated sub-clusters, the BSC derives the initial parameters.
The BSC second step is performed by the SC algorithm. The BSC
builds a dendrogram in order to represent the dataset splitting.
Each sub-cluster, or node, links two successor sub-clusters in the
dendrogram. When three or more nodes are available in one
dendrogram level, the algorithm needs to choose a node to split.
The BSC third step uses the information gain as the node choice
rule. This work analyses the SC algorithm and two main variants of
BSC. The first variant uses the RPDDP as initial parameter
determiner, and the second, uses the EM algorithm as initial
parameter determiner. The Bhattacharyya (B), Kullback-Leibler (KL)
and Hellinger (H) stochastic distances are analysed in this work.
In total, nine algorithms are evaluated: SC-B, SC-KL, SC-H,
BSC-R-B, BSC-R-KL, BSC-R-H, BSC-EM-B, BSC-EM-KL, BSC-EM-H. The
algorithms were analysed in a quantitative and qualitative way.
The quantitative analysis consists in the confusion matrix and
accuracy estimation, and the qualitative analysis explore the BSC
dendrogram and the clusters scattering mechanism by inspecting the
Plan H \− alpha. RESUMO: As imagens PolSAR (Polarimetric
Synthetic Aperture Radar) podem ser representadas por um conjunto
de matrizes definidas positivas Hermitianas complexas, que possuem
um tensor m{\'e}trico Riemanniano. As imagens PolSAR tamb{\'e}m
s{\~a}o conhecidas por seguir a distribui{\c{c}}{\~a}o de
Wishart e, usando a fun{\c{c}}{\~a}o de contraste da teoria da
informa{\c{c}}{\~a}o, dist{\^a}ncias estoc{\'a}sticas entre as
distribui{\c{c}}{\~o}es de Wishart podem ser derivadas. Este
trabalho aborda estrat{\'e}gias de classifica{\c{c}}{\~a}o
n{\~a}o supervisionadas, explora a geometria de Riemann e estuda
dist{\^a}ncias estoc{\'a}sticas aplicadas {\`a}s imagens
PolSAR. O algoritmo proposto, denominado Bisecting Stochastic
Clustering (BSC), {\'e} uma combina{\c{c}}{\~a}o entre o
algoritmo Stochastic Clustering (SC) e o algoritmo
hier{\'a}rquico divisivo. O algoritmo SC {\'e} uma t{\'e}cnica
baseada no K-m{\'e}dias, que usa dist{\^a}ncias
estoc{\'a}sticas como m{\'e}trica de similaridade. O algoritmo
SC pode, geralmente, ficar preso em um m{\'{\i}}nimo local, o
que leva a agrupamentos incorretos. Por isso, a escolha de bons
par{\^a}metros iniciais {\'e} essencial para a qualidade do
agrupamento. O algoritmo BSC {\'e} um procedimento top-down, ele
come{\c{c}}a com todas as amostras em um {\'u}nico cluster, que
{\'e} sucessivamente dividido em dois novos subclusters. Este
algoritmo {\'e} dividido em tr{\^e}s etapas: a
determina{\c{c}}{\~a}o do par{\^a}metro inicial, o procedimento
de bi-particionamento do cluster e a escolha de um cluster
adequado para dividir. Neste trabalho, dois algoritmos para a
determina{\c{c}}{\~a}o dos par{\^a}metros iniciais s{\~a}o
testados: o algoritmo Expectation-Maximization (EM) para o Modelo
de Mistura de Wishart e o Particionamento Divisivo da
Dire{\c{c}}{\~a}o Principal de Riemann (RPDDP). O RPDDP {\'e}
um novo algoritmo, proposto com objetivo de realizar a
bi-parti{\c{c}}{\~a}o de um conjunto de dados. Este algoritmo
estima a matriz de covari{\^a}ncia do conjunto de dados sob a
geometria de Riemann, a fim de encontrar a componente principal,
que {\'e} usada para separar os dados de entrada em dois
subclusters. A partir dos dois subclusters estimados pelo RPDDP, o
BSC deriva os par{\^a}metros iniciais. A segunda etapa do BSC
{\'e} realizada pelo algoritmo SC. O BSC constr{\'o}i um
dendrograma para representar a divis{\~a}o do conjunto de dados.
Cada sub-cluster, ou n{\'o}, {\'e} ligado a dois sub-grupos
sucessores no dendrograma. Quando h{\'a} tr{\^e}s ou mais
n{\'o}s dispon{\'{\i}}veis em um n{\'{\i}}vel de dendrograma,
o algoritmo precisa escolher um n{\'o} para ser dividido. A
terceira etapa do BSC usa o ganho de informa{\c{c}}{\~a}o como
regra de escolha desse n{\'o}. Este trabalho analisa o algoritmo
SC e as duas variantes principais do BSC. A primeira variante usa
o RPDDP como determinador dos par{\^a}metros iniciais e a
segunda, usa o algoritmo EM. As dist{\^a}ncias estoc{\'a}sticas
de Bhattacharyya (B), Kullback-Leibler (KL) e Hellinger (H)
s{\~a}o analisadas neste trabalho. No total, nove algoritmos
s{\~a}o avaliados: SC-B, SC-KL, SC-H, BSC-R-B, BSC-R-KL, BSC-RH,
BSC-EM-B, BSC-EM-KL, BSC-EM-H. Os algoritmos foram analisados de
forma quantitativa e qualitativa. A an{\'a}lise quantitativa
consiste no calculo da matriz de confus{\~a}o e na estimativa da
acuracia; a an{\'a}lise qualitativa explora o dendrograma e os
mecanismos de espalhamento dos clusters atrav{\'e}s da
inspe{\c{c}}{\~a}o do Plan H\− alpha.",
committee = "K{\"o}rting, Thales Sehn (presidente) and Sant'Anna, Sidnei
Jo{\~a}o Siqueira (orientador) and Bins, Leonardo Sant'Anna
(orientador) and Shiguemori, Elcio Hideiti and Carvalho, Solon
Ven{\^a}ncio de and Correia, Antonio Henrique and Sousa
J{\'u}nior, Manoel de Ara{\'u}jo",
englishtitle = "Bi-divis{\~a}o estoc{\'a}stica de agrupamento: um novo algoritmo
para classifica{\c{c}}{\~a}o n{\~a}o supervisionada de imagens
polSAR",
language = "en",
pages = "179",
ibi = "8JMKD3MGP3W34R/43RU675",
url = "http://urlib.net/ibi/8JMKD3MGP3W34R/43RU675",
targetfile = "publicacao.pdf",
urlaccessdate = "28 abr. 2024"
}